Copyright©2014. Grupo Editorial Patria. All rights reserved. 


CAPÍTULO 2 


Anàlisis de varianza 
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INTRODUCCIÓN 

El anàlisis de varianza ( analysis ofvariance, Anova) es una herramienta estadística que permite probar la igual- 
dad de tres o mas medias poblacionales con los datos obtenidos con muestras de cada una de estas poblaciones. 

Con el anàlisis de varianza podemos hacer inferencias acerca de si nuestras muestras se tomaron de poblaciones 
que tienen la misma media. Algunos ejemplos donde podemos aplicar este anàlisis son: 

• En una universidad, deseamos comparar cuàl de cuatro métodos distintos de ensenanza-aprendizaje de es¬ 
tadística (presencial, autodidacta, multimedia, sistema abierto) permite obtener un aprendizaje màs ràpido 
de la matèria. 

• Para una empresa que produce tres tipos de gasolina sin azufre (Nova, Magna y Premium) comparar el 
rendimiento del kilometraje producido en motores de combustión interna. 

• Comparar los ingresos recibidos el primer ano por los egresados de cuatro universidades públicas de la 
Ciudad de México (unam, uam, ipn, ucm). 

• Medir si la concentración de contaminantes en la ciudad de Monterrey presenta características similares o 
distintas en cada 1 de las 4 estaciones del ano, lo cual permitirà determinar políticas públicas para el control 
de contaminantes en la ciudad. 

El anàlisis de cada factor podria hacerse por pares, por ejemplo, en el caso del rendimiento del kilometraje por 
tipo de gasolina, las comparaciones podrían hacerse como: Nova-Magna, Nova-Premium y Magna-Premium. Lo 
que representa desarrollar pruebas de hipòtesis con dos muestras, 1 pero aquí, la prueba estadística comprende 
como ya indicamos tres o màs muestras a la vez (Nova-Magna-Premium). 

Como puede observarse de los ejemplos, el Anova consistiria en hacer pruebas para encontrar las diferencias 
entre las medias poblacionales. Para el ejemplo de los rendimientos de kilometraje obtenido con las diversas ga- 
solinas, comparamos el rendimiento de la gasolina Nova con el rendimiento de la gasolina Magna y con el rendi¬ 
miento de la gasolina Premium; este anàlisis implica un examen de las varianzas (o variaciones) de cada muestra, 
de aquí el nombre del procedimiento estadístico de anàlisis de varianza. La inferència obtenida nos indicarà si los 
rendimientos de cada combustible son iguales o diferentes. 

Otra de las aplicaciones del anàlisis de varianza es el anàlisis de los resultados en un anàlisis de regresión en 
donde por un lado se cuenta con datos experimentales y por otro con datos producto de una observación al mismo 
tiempo. 

Conceptos bàsicos 

El principal objetivo del anàlisis de varianza es identificar el factor o los factores que producen la variabilidad en 
un conjunto de datos. 

Si un solo factor (variable independiente) es el que produce esta variabilidad, entonces el anàlisis de varianza 
recibe el nombre de anàlisis de varianza de un solo factor o One-way Anova. 

Cada factor està asociado con un conjunto particular de datos (muestra) o tratamientos (variable dependiente). 
El término tratamiento se origina de la agricultura, ya que en ésta se utilizó por primera vez este procedimiento 
estadístico. Los tratamientos se derivaron de tratar varias parcelas de tierra con diferentes fertilizantes para medir 
el factor de rendimiento promedio por cultivo. 

Suponga ahora que obtenemos una muestra aleatòria para el tratamiento i [x. v x j2 , x jV ..., x.] . Entonces, 
i = 1, 2, 3, . n se refiere a cada tratamiento o muestra en el problema y j = 1, 2, 3, ..., n, a cada dato que forma 
la muestra o tratamiento ( véase el cuadro 2.1). 


1 Véase el tema de “Pruebas con dos muestras” en Rodríguez, J. Pierdant, A. y Rodríguez, C. (2008), Estadística para administración , Grupo Edito¬ 
rial Patria, México, pp. 405-420. 
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Cuadro 2.1 Cuadro estadístico que muestra los tratamientos y sus datos. 


Datos del tratamiento 



Es necesario observar que en este caso cada tratamiento i tiene el mismo número de datos n, pero el modelo se 
puede generalizar cuando existen tratamientos que presentan diferente número de datos. 

Por tanto, en este procedimiento estadístico se requieren tres supuestos: 

• Cada tratamiento (población) està normalmente distribuida. 

• Todos los tratamientos (poblaciones) tienen la misma varianza [(oj 2 ]. 

• Las muestras de cada tratamiento se seleccionan independientemente. 

Con base en estos supuestos, el anàlisis de varianza consiste en decidir si las “i” muestras o tratamientos se toma- 
ron de poblaciones que tienen la misma media/í. Para ello se establecen dos hipòtesis de prueba. 2 

• H () : /u l = ju 2 = ... fj. r es decir, la media de todas las poblaciones es igual. 

• H : fj. x n 2 ï* ... fj. r es decir, las medias poblacionales son distintas. 

El anàlisis de varianza, por tanto, nos indicarà si las medias de todas las poblaciones son iguales; es decir, no hay 
una variación significativa entre ellas, o bien, si entre éstas hay una variación significativa, ya que este compor- 
tamiento puede presentar alguna de las cuatro características siguientes. 

1. No hay variación entre poblaciones (tratamientos) ni dentro de cada una de ellas. 

Consideremos el ejemplo de las gasolinas, probando su rendimiento (kilómetros por cada litro) en doce motores 
de combustión interna y se obtienen los resultados que se muestran en el cuadro 2.2. 

Cuadro 2.2 Probando el rendimiento de las gasolinas en kilómetros por litro. 


cn 

s> Kilómetros por litro 

w - 


-C 

D) 

Tratamiento 

Motor 1 

Motor 2 

Motor 3 

Motor 4 

Promedio 

< 

.55 

Nova 

10 

10 

10 

10 

10 

00 

CL 

Magna 

10 

10 

10 

10 

10 

O 

T3 

Premium 

10 

10 

10 

10 

10 

O 

Q. 

3 




Promedio de los promedios = 

10 


Ü 

5 2. Hay variación entre poblaciones (tratamientos), pero no dentro de cada una de ellas. 

CM 


Continuando con el ejemplo del rendimiento por kilómetro de cada gasolina, los resultados para este caso se 
muestran en el cuadro 2.3. 

2 Recuerde que H Q representa la hipòtesis nula y H x la hipòtesis alternativa. Le sugerimos revisar el tema de Pruebas de Hipòtesis en Rodríguez J., 
Pierdant A. y Rodríguez C. [2008], Estadística para administración, GE Patria, México, pp. 385-420. 
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Cuadro 2.3 Rendimiento por kiómetro de cada gasolina. 

Kilómetros por litro 


Tratamiento 

Motor 1 

Motor 2 

Motor 3 

Motor 4 

Promedio 

Nova 

9.5 

9.5 

9.5 

9.5 

9.5 

Magna 

10 

10 

10 

10 

10 

Premium 

11 

11 

11 

11 

11 




Promedio de los promedios = 

10.17 


3. No hay variación entre poblaciones (tratamientos) pero sí dentro de cada una de ellas. 
Los resultados para este caso se muestran en el cuadro 2.4. 

Cuadro 2.4 


Kilómetros por litro 


Tratamiento 

Motor 1 

Motor 2 

Motor 3 

Motor 4 

Promedio 

Nova 

8 

10 

12 

10 

10 

Magna 

10 

9 

10 

11 

10 

Premium 

12 

10 

8 

10 

10 




Promedio de los promedios = 

10 


4. 


Hay variación entre poblaciones (tratamientos) y también dentro de cada una de las mismas (véase el cuadro 
2.5). 


Cuadro 2.5 


Kilómetros por litro 


Tratamiento 

Motor 1 

Motor 2 

Motor 3 

Motor 4 

Promedio 

Nova 

9 

10 

13 

10 

10.5 

Magna 

10 

9 

10 

11 

10.0 

Premium 

12 

10 

11 

13 

11.5 




Promedio de los promedios = 

10.7 
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Anàlisis de varianza 

El anàlisis de varianza està fundamentado en una comparación de dos estimaciones diferentes de la varianza (a) 2 
de una población total. 

• La primera consiste en determinar un càlculo de la varianza entre las medias muestrales (medias de los 
tratamientos). 

• La segunda, realizar un càlculo de la varianza dentro de las muestras; es decir, calcular la varianza dentro 
de cada tratamiento. 

Si al comparar ambas estimaciones su valor es aproximadamente igual, se acepta la hipòtesis nula ( H Q ), en caso 
contrario las diferencias que muestran los diversos tratamientos de un problema son significativas. Para ilustrar 
ambos procedimientos de càlculo y la prueba de hipòtesis correspondiente usaremos el problema siguiente: 
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Ejemplo 2.1 


Una companía capacita a sus empleados del 
àrea de calidad mediante tres técnicas dis- 
tintas: presencial, a distancia (por internet) 
y una tècnica multimedia. Desea conocer si 
estos programas representan diversos nive- 
les de productividad para los empleados. Se 
toma una muestra aleatòria de 14 empleados 3 
que han sido capacitados mediante estos tres 
métodos y se les aplica una evaluación para 
medir su productividad (véase el cuadro 2.6). 


Cuadro 2.6 Calificación de empleados. 


Tècnica 

Empleado 1 

Empleado 2 

Empleado 3 

Empleado 4 

Presencial 

8.5 

7.2 

8.3 


A distancia 

8.0 

8.4 

7.8 

8.2 

Multimedia 

8.2 

8.0 

9.0 

8.8 


Calculo de la varianza entre las medias muestrales 


Debemos obtener una estimación de la varianza de la po- 
blación a partir de la varianza entre los “1” tratamientos 
(muestras) que tengamos en el problema. En estadísti¬ 
ca, esta estimación recibe el nombre de varianza entre 
colwnnas, ya que la matriz de tratamientos se maneja a 
través de su transpuesta (véase el cuadro 2.7). Para nues- 
tro problema, debemos obtener la varianza entre los tres 
tratamientos (técnicas de capacitación). 

Para calcular la varianza de cada tratamiento (muestra) 
empleamos la ecuación 2.1: 4 


S 2 


ZUxi-x ) 2 
n — 1 


( 2 . 1 ) 


Cuadro 2.7 Tècnica de capacitación. 



Presencial 

A distancia 

Multimedia 

Empleado 1 

8.5 

8.0 

8.2 

Empleado 2 

7.2 

8.4 

8.0 

Empleado 3 

8.3 

8.1 

8.5 

Empleado 4 

8.0 

7.8 

9.0 

Empleado 5 


8.2 

8.8 

Media 

8.0 

8.1 

8.5 

Promedio de todas las observaciones 

8.2 


Pero nosotros calcularemos la varianza entre tratamientos (entre columnas), por lo que en la ecuación 2.1 debe¬ 
mos sustituir cada dato x l por la media de cada tratamiento o muestra X , la media de la muestra X por la media 
de todas las observaciones X y n el número de datos por k el número de tratamientos o muestras. Con lo cual se 
obtendrà la ecuación 2.2 de la varianza entre medias muestrales (tratamientos) S\ siguiente: 


S 


2 

X 


ZUxi-xf 

k -1 


( 2 . 2 ) 


Con la varianza entre medias muestrales (ecuación 2.2) debemos calcular ahora la varianza entre medias pobla- 
cionales a través de la ecuación 2.3 del error estàndar de la media: 


a 



(2.3) 


Elevando al cuadrado (la ecuación 2.3) y despejando o 2 obtenemos la ecuación de la varianza de la población 
(2.4). 


3 En la pràctica, 14 empleados no constituyen una muestra estadística, pero nos hemos limitado a este número para poder mostrar las técnicas bàsicas 
del anàlisis de varianza, evitando así una gran cantidad de càlculos repetitivos. Por otro lado, es importante recordar que, si los tamanos de las 
muestras de los tratamientos son suficientemente grandes, no serà necesario realizar la suposición de normalidad. 

4 Véase el tema de “Varianza” en Rodríguez J., Pierdant A. y Rodríguez C. (2008), Estadística para administración, GE Patria, México, pp. 
138-141. 
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a 


2 

X 


O 


n 


a- = no\ (2.4) 


Pero a\ es la varianza entre medias muestrales S\ , por lo que al sustituirla en la ecuación 2.4 obtenemos la 
estimación de la varianza entre columnas (ecuación 2.5) que representa la primera estimación de la varianza de 
la población con base en la varianza entre medias de tratamientos (muestrales). 


UX> - xf 

k -1 


k -1 


(2.5) 


donde, 

o 2 ec = Primera estimación de la varianza de la población con base en la varianza entre las medias de las mues- 
tras o tratamientos (varianza entre columnas). 

n. = Tamano de la i-ésima muestra, i = 1, 2, 3,..., k muestra o tratamiento. 

X = Media muestral de la i-ésima muestra i = 1, 2, 3 ,..k muestra o tratamiento. 

X = Gran media es el promedio de todas las observaciones. 

k = Número total de muestras o tratamientos. 

Para nuestro problema, el calculo de la estimación de la varianza entre columnas se muestra en el cuadro 2.8. 


Cuadro 2.8 Calculo de la estimación de la varianza entre columnas. 


Tècnica 

n , 

x, 

X 

X-X 

(X,.-X) 2 

n j (X j - Xf 

Presencial 

4 

8.0 

8.2 

-0.2 

0.040 

0.160 

A distancia 

5 

8.1 

8.2 

-0.1 

0.010 

0.050 

Multimedia 

5 

8.5 

8.2 

0.3 

0.090 

0.450 


SUMA 0.660 

Varianza entre columnas = SUMA/{K-1) = 0.330 


En la fórmula 2.5, el numerador que representa la suma del cuadrado del valor de todos los tratamientos 


f k 

SUMA = 'Y j n i (x : - X ) 2 


V 


i—1 


recibe el nombre de suma de cuadrados entre muestras ( SCM ). 


Para nuestro problema, SCM = 0.660 


Calculo de la varianza dentro de las muestras 

El anàlisis de varianza requiere un segundo calculo para estimar la varianza de la población. A este calculo se le 
denomina varianza dentro de las muestras y no es mas que un promedio ponderado de la medición de la varia- 
ción que se presenta dentro de cada muestra o tratamiento. En estadística a este procedimiento se le conoce como 
varianza dentro de columnas ( o 2 DC ). 

Como indicamos previamente, la varianza de una muestra o tratamiento se puede calcular con la ecuación 2.1. 

^Uixi-Xf 

s 2 = --- ( 2 - 1 ) 

n — 1 
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Dado que un supuesto del anàlisis de varianza indica que la varianza de las poblaciones de donde se han ob- 
tenido las muestras es la misma para todas, esto nos permitiría tomar cualquiera de las varianzas muestrales 
(Sf, S 2 , ... Sf) como una segunda estimación de la varianza de la población; sin embargo, se puede obtener 
mejor estimación de la varianza poblacional mediante el promedio ponderado de las varianzas de las k muestras. 
La ecuación 2.6 muestra la forma general para esta segunda estimación de la varianza poblacional o 2 . 


donde, 


n. = 

l 

k = 


a 


2 

DC 



( 2 . 6 ) 


Segunda estimación de la varianza de la población, con base en la varianza dentro de las muestras (va¬ 
rianza dentro de columnas). 

Tamano de la /-ésima muestra o tratamiento, i = 1, 2, 3, .k muestra. 

Número total de muestras o tratamientos. 


Para nuestro problema, el calculo de la varianza dentro de las muestras se efectua de la manera siguiente: 
Calculamos las varianzas de cada muestra o tratamiento (véase el cuadro 2.9) con base en la ecuación 2.1. 


< 

.(ú 

c5 

CL 


o 

Q. 


0 


CL 

o 
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Cuadro 2.9 Varianzas de cada muestra o tratamiento. 



Tècnica de capacitación 

Presencial A distancia Multimedia 

Varianza 1 
(X-X) 2 

Varianza 2 
(X-X) 2 

Varianza 3 
(X-X) 2 

Empleado 1 

8.5 

8.0 

8.2 

0.250 

0.010 

0.090 

Empleado 2 

7.2 

8.4 

8.0 

0.640 

0.090 

0.250 

Empleado 3 

8.3 

8.1 

8.5 

0.090 

0.000 

0.000 

Empleado 4 

8.0 

7.8 

9.0 

0.000 

0.090 

0.250 

Empleado 5 


8.2 

8.8 


0.010 

0.090 

X 

8.0 

8.1 

8.5 







Suma = 

0.980 

0.200 

0.680 




Suma/(n-1) 

0.327 

0.050 

0.170 


Los cuadrados en cada varianza de las muestras se suman ( Suma = Y(xi-X) 2 ), como se muestra en el renglón 
Suma en el cuadro 2.9. Í=1 


Posteriormente estas sumas se suman nuevamente para obtener la suma de cuadrados dentro de muestras 

k 

(,SCDM = Y^Suma,). 

i=\ 

Para nuestro problema, scdm = 0.98 + 0.20 + 0.68 = 1.86: 


Calculamos el promedio ponderado de las varianzas de las k muestras (k = 3 muestras para el problema). 


I»’ 


S‘, 


(2.6) 


n, 


n { s] + n 2 s\ + n 3 s \ 
n A + n 1 + n 3 
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2 _ 4(0.327)+ 5(0.050)+ 5(0.170) 
° DC ~ 4 + 5 + 5 

<= 0.172 

Con lo cual se obtiene la varianza dentro de las muestras. 


1.308 + 0.25 + 0.85 
14 


< 

.çg 

c5 

CL 


o 

Q. 


0 


CL 

O 


O 


Prueba de hipòtesis mediante el estadístico F 

Una vez que contamos con las dos estimaciones de la varianza de la población, el siguiente paso es compararlas 
mediante el calculo del cociente siguiente: 

F _ Varianza entre las medias muestrales (o 2 EC ) ^ 

Varianza dentro de las muestras (o) K ) 


Este cociente recibe el nombre de estadístico F, en el cual podemos observar que, si ambas varianzas son iguales 
o parecidas (numerador y denominador), entonces la hipòtesis nula es vcrdadcra (u=u, = ■■■ /.q); es decir, la media 
de las “k” poblaciones es igual o casi igual, ya que no hay variabilidad entre muestras ni dentro de las mismas. 

En este caso, el estadístico F tiende al valor 1 o es muy cercano a éste, por lo que debemos aceptar la hipòtesis 
nula. En caso contrario, conforme el cociente F crece, la variabilidad de las medias poblacionales es significativa, 
por lo cual deberemos aceptar la hipòtesis alternativa, las medias poblacionales son significativamente distintas: 


■■■ pt t (se rechaza la hipòtesis nula) 
Para nuestro problema, el estadístico F toma el valor siguiente: 


(<) _ 0.330 
(«0.172 


1.918 


El estadístico F, resultado de este cociente, presenta una distribución de probabilidad específica que no es única, 
ya que cada problema analizado con este método presentaria una distribución de probabilidad distinta; es decir, 
en realidad es una familia completa de distribuciones ( véase la gràfica 2.1). 


En la gràfica 2.1 se observa que cada distribución està 
definida por un par de grados de libertad. El primer valor 
se refiere a los grados de libertad del numerador (g ) del 
cociente F; el segundo valor corresponde, a los grados 
de libertad del denominador (g ) y que la distribución 
F depende del número de grados de libertad tanto del 
numerador como del denominador, pero en general està 
sesgada a la derecha, tiene una sola moda y tiende a ser 
màs simètrica a medida que este par de grados de liber¬ 
tad aumentan. 

Ahora bien, para calcular los grados de libertad del nu¬ 
merador (gj usaremos la relación siguiente: 

g n = (número de muestras -1) = (k -1) (2.7a) 

Y para calcular los grados de libertad del denominador 
usamos la relación (2.8): 
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g = (total de datos de todas las muestras - el número de muestras) 
g d = ((n l +n 2 + ...+rt k )-k) (2.8) 

Para llevar a cabo la prueba de hipòtesis F debemos comparar el valor encontrado al comparar las varianzas po- 
blacionales y su valor calculado en una tabla F (también podemos usar la función de distribución inversa de F de 
la hoja electrònica de Excel =distr.f.inv(alfa, g n , g j). 

Si usamos el cuadro de la distribución de probabilidad F que se ubica en el anexo de cuadros, debemos espe¬ 
cificar primero el nivel de significación alfa ( a ) que usaremos en la prueba, posteriormente el número de grados 
de libertad del numerador (g), que en el cuadro se ubica en las columnas, y finalmente, los grados de libertad del 
denominador (g ), ubicados en los renglones de la tabla. 

Para nuestro problema, suponga que el director de capacitación desea probar a un nivel de signiíicancia de 0.05 
(a = 0.05) la hipòtesis de que no existe diferencia entre las tres técnicas de capacitación. Entonces, una forma 
de hacerlo es buscar en la tabla de la distribución F con a = 0.05 g = (3 - 1) = 2, y g d = (14 - 3) = 11 (véase el 
cuadro 2.10). 


Cuadro 2.10 Distribución Fcon a = 0.05 g = (3 - 1) = 2,y g= (14 -3) = 11. F(0.05,2,11) 



12 

13 

14 


4,75 

4,67 

4,60 


3,89 

3,81 

3,74 


3,49 

3,41 

3,34 


3,26 

3,18 

3,11 


3,11 

3,03 

2,96 


3,00 

2,92 

2,85 


2,91 

2,83 

2,76 


2,85 

2,77 

2,70 


2,80 

2,71 

2,65 


El valor encontrado en la tabla es de 3.98 y establece el límite superior de la región de aceptación, como se mues- 
tra en la gràfica 2.2. 


< 

.d 

c5 

CL 


o 

Q. 


0 


CL 

o 


O 



Gràfica 2.2 Límite superior de la región de aceptación. 


Como el valor de la muestra calculado, F = 1.918, se encuentra dentro de la región de aceptación, aceptamos 
la hipòtesis nula y concluimos que, según la información estadística de las muestras que poseemos, no existen 
diferencias significativas en su nivel de productividad al recibrr una capacitación en calidad por cualquiera de 
estas tres técnicas. 
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Estadística aplicada II 


En Excel, el valor de F se obtiene con la función: 

=DISTR.F.INV(a, g n , g d ) 


Sustituyendo valores: 


=distr.f.inv(0.05, 2, 11) 


Obtenemos: 


3.98229796 

Cuadro resumen del anàlisis de varianza para un factor 

En el àmbito estadístico se acostumbra elaborar un cuadro resumen de los càlculos realizados en un anàlisis de 
varianza (véase el cuadro 2.11). 


Cuadro 2.11 Formato del cuadro para el anàlisis de varianza de un factor de muestra. 


Fuente 

Suma de cuadrados 

Grados de libertad 

Varianza de la media 

F 

p 

Entre muestras 
(tratamientos) 

SCM 

k--\ 

a lc 

K) 

{<) 

Significancia 

(sig.) 

Dentro de muestras 
de error 

SCDM 

n-k 

° 2 dc 



Variación total 

SCM + SCDM 

n -1 





Nota: n = n,+ n 2 + ... + n k , suma del número de datos de todas las muestras. 
k= número de muestras o tratamientos. 


Para nuestro problema, el cuadro resumen del anàlisis de varianza para el factor tipo de capacitación (véase el 
cuadro 2.12) es: 


< 

.çg 

c5 

CL 


o 

Q. 


0 


CL 

o 


O 


Cuadro 2.12 Resumen del anàlisis de varianza para el factor tipo de capacitación. 


Fuente 

Suma de 
cuadrados 

Grados 
de libertad 

Varianza 
de la media 

Entre muestras 
(tratamientos) 

0.66 

2 

0.33 

Dentro de muestras 
de error 

1.86 

11 

0.172 

Variación total 

2.52 

13 



Mediante el paquete estadístico spss para el problema, el cuadro de anàlisis de varianza de un factor se muestra 
en el cuadro 2.13. 
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Cuadro 2.13 Anàlisis de varianza de un factor. 


ANOVA 

Calificación en evaluación 


Sume 
of squares 

df 

Mean square 

F 

S/g. 

Between groups 

0.657 

2 

0.329 

1.943 

0.189 

Within groups 

1.860 

11 

0.169 



Total 

2.517 

13 





Empleo del valor p en las pruebas de hipòtesis 5 

Con el uso de los paquetes estadísticos para computadoras, apareció el concepto del valor p, un nuevo enfoque 
que permite probar hipòtesis. 

El valor p es la probabilidad de obtener un estadístico de prueba igual o mas extremo que el resultado obtenido a 
partir de los datos muestrales, dado que la hipòtesis nula H es cierta. 

En otras palabras, el valor p es el nivel mas bajo de significancia (a) al cual se puede rechazar la hipòtesis nula. 
Comprende el àrea en la cola que està màs allà del valor del estadístico para la muestra. A medida que el esta¬ 
dístico de la prueba se adentra en la región de rechazo, indica mayor evidencia para rechazar la hipòtesis nula, 
observando que el valor p se hace màs pequeno. 

Suponiendo que la hipòtesis nula H es cierta, un valor p muy pequeno es una fuerte evidencia para rechazar la 
hipòtesis nula, ya que indica que el dato observado es muy poco probable que se presente. 

Al valor p también se le conoce como el nivel observado de significancia. 

La regla, por tanto, para rechazar una hipòtesis nula mediante el uso del valor p es: 

Rechace H (j si el valor p < a 

Independientemente del tipo de prueba de hipòtesis a que se haga referencia, esta regla es vàlida para pruebas de 
hipòtesis de dos extremos o bien de un extremo. 

Para nuestro problema, el valor p es mayor que a (0.189 > 0.05), por lo que debe aceptarse la hipòtesis nula. 


Ejemplo 2.2 

La Secretaria de Ecologia del gobierno de Nuevo León està analizando establecer nuevas reglas ecológicas 
debido a la concentración de contaminantes en la ciudad de Monterrey. La secretaria propone un reglamento 
que impone reglas específicas de control de contaminantes en cada estación del ano, bajo la hipòtesis de que las 
condiciones ambientales cambian esta concentración. El ayuntamiento considera que esto no es necesario, pues 
su hipòtesis versa en el sentido de que la concentración de contaminantes es similar independientemente de la 
estación del ano. Por tanto, se solicita el estudio a la universidad estatal con la finalidad de determinar la mejor 
política pública para el control de contaminantes en la ciudad. 


CL 

o 


O 


5 Tornado de Rodríguez J., Pierdant A. y Rodríguez C. (2008), Estadística para administración, Grupo Editorial Patria, México, pp. 401-402. 
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Estadística aplicada II 


El laboratorio de ecologia de la Universidad Autònoma de Nuevo León (uanl) cuenta con una muestra de seis me- 
diciones realizadas en el transcurso de cada una de las cuatro estaciones del ano pasado (véase el cuadro 2.14). 


Cuadro 2.14 Concentración de contaminantes en Monterrey, Nuevo León. 


Medición 

Primavera 

Verano 

Otono 

Invierno 

1 

5.62 

7.70 

2.52 

6.77 

2 

6.12 

8.31 

5.44 

6.65 

3 

6.62 

8.80 

4.94 

6.01 

4 

6.21 

8.24 

2.99 

6.26 

5 

7.08 

7.87 

4.39 

7.09 

6 

5.36 

7.44 

4.44 

6.05 


La universidad decide aplicar un anàlisis de varianza para el factor estación del ano, y probar la hipòtesis del 
ayuntamiento en el sentido de que la concentración de contaminantes no cambia con la estación del ano. 

• H 0 : fi = = ... = u', es decir, la media de concentración de contaminantes es igual en cualquier estación 

del ano (hipòtesis del ayuntamiento de Monterrey). 

• H l : ju j /u ï* ... ^ /ij, es decir, las medias de concentración de contaminantes son distintas y dependen de 
las características de cada estación del ano (hipòtesis de la Secretaria de Ecologia estatal). 

SOLUCIÓN 

Una vez que hemos establecido ambas hipòtesis, el primer paso consiste en determinar la varianza entre las me¬ 
dias muestrales o varianza entre columnas ( véase el cuadro 2.15). 


< 

d 

c5 

CL 


o 

Cl 


0 


CL 

o 


O 


Cuadro 2.15 Varianza entre columnas. 


Estación 

n. 

X 

X 

X-X 

(X-X) 2 

n. (x -x ) 2 

Primavera 

6 

6.2 

6.2 

0.0 

0.001 

0.008 

Verano 

6 

8.1 

6.2 

1.9 

3.460 

20.758 

Otono 

6 

4.1 

6.2 

-2.1 

4.326 

25.958 

Invierno 

6 

6.5 

6.2 

0.3 

0.074 

0.443 






Suma = 

47.167 



Varianza entre columnas 

= Suma/ (/f — 1) 

= 15.722 



Por tanto, del cuadro 2.15 sabemos que scm = 47.167. 

En este método se requiere un segundo calculo para estimar la varianza de la población denominado la varianza 
dentro de las muestras (véase el cuadro 2.16). 


Cuadro 2.16 Varianza dentro de las muestras. 



Primavera 

Estación del ano 

Verano Otono 

Invierno 

Varianza 1 

Varianza 2 

Varianza 3 

Varianza 4 

medición 

(x-Xf 

(x-Xf 

1 

><l 

(x-Xf 

1 

5.62 

7.7 

2.52 

6.77 

0.301 

0.130 

2.560 

0.089 

2 

6.12 

8.31 

5.44 

6.65 

0.002 

0.063 

1.742 

0.032 

3 

6.62 

8.8 

4.94 

6.01 

0.204 

0.548 

0.672 

0.213 

4 

6.21 

8.24 

2.99 

6.26 

0.002 

0.032 

1.277 

0.045 

5 

7.08 

7.87 

4.39 

7.09 

0.831 

0.036 

0.073 

0.382 

6 

5.36 

7.44 

4.44 

6.05 

0.653 

0.384 

0.102 

0.178 

X 

6.2 

8.1 

4.1 

6.5 






Suma = 

1.993 

1.193 

6.427 

0.939 

Suma/(n-1) 

0.399 

0.239 

1.285 

0.188 


Rodríguez, Franco, Jesús, and Rodríguez, Alberto Isaac Pierdant. Estadística aplicada II: estadística en administración para la toma de decisiones, Grupo Editorial Patria, 2014. 

ProQuest Ebook Central, http://ebookcentral.proquest.com/lib/vallemexicosp/detail.action?doclD=3227358. 

Created from vallemexicosp on 2018-04-29 19:53:41. 




























Anàlisis de varianza 


67 


• Calculamos la suma de cuadrados dentro de la media j SCDM = ^ ( Suma) j J 

scdm = 1.993 + 1.193 + 6.427 + 0.939 = 10.552 

• Calculamos el promedio ponderado de las varianzas de las k muestras (k = 4) para obtener la varianza den¬ 
tro de las muestras. 


°lc = 


E k 2 

^ ( 2.0 

-i n i 

6(0.399) + 6(0.239) + 6(1.285) + 6(0.188) 12.662 


= 0.528 


6 + 6 + 6 + 6 24 

Con las dos estimaciones de la varianza de la población, calculamos el estadístico F. 

( °lc) 


F = 


(' a lc) 


E=™ =29.776 
0.528 


Determinamos los grados de libertad tanto del numerador (g H ) como del denominador (gj y obtenemos el valor 
del estadístico F en los cuadros o mediante Excel. 

g r = (número de muestra —1) = (4 —1) = 3 

g = (total de datos de todas las muestras - el número de muestras) 
g d = ((», + » 2 + - n) — k) = 24 — 4 = 20 


< 

.çç 

c5 

CL 


o 

Q. 


0 


CL 

o 


O 


En el ejemplo, el ayuntamiento de Monterrey desea probar que la concentración de contaminantes es igual en 
cada estación del ano, por lo que propone probar su hipòtesis a un nivel de signifïcancia de 0.05 (a = 0.05). En- 
tonces, una forma de hacerlo es buscar el valor en la tabla de la distribución F con a = 0.05, g = 3, y g d = 20. 


• El valor en los cuadros encontrado es: 3.10 

• con Excel, =distr.f.inv(0.05, 3, 20) 

Obtenemos: 

3.0984 

• Este valor establece el límite superior de la región de aceptación, como se muestra en la gràfica 2.3. 
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Estadística aplicada II 


• Como el valor calculado de F = 29.776, éste se encuentra fuera de la región de aceptación (29.776 > 3.10), 
rechazamos la hipòtesis nula y concluimos que, según la información estadística de las muestras que po- 
seemos, existen diferencias signiíicativas en la concentración de contaminantes durante las estaciones del 
ano en la ciudad. 

• Entonces deberà aceptarse la propuesta de la Secretaria de Ecologia estatal. 

• Con la información de los càlculos realizados en nuestro ejemplo, podemos elaborar un cuadro resumen 
del anàlisis de varianza del factor: estación del ano (véase el cuadro 2.17). 


Cuadro 2.17 


Fuente 

Suma de 
cuadrados 

Grados 
de libertad 

Varianza 
de la media 

F 

P 

Entre muestras 
(tratamiento) 

47.167 

3 

15.722 

29.776 

0.000 

Dentro de muestras 
(error) 

10.552 

20 

0.528 



Variación total 

57.719 

23 





En el cuadro 2.17 se observa que el valor p es menor que a (0.00 < 0.05), lo que nos indica que debemos 
rechazar la hipòtesis nula ( H Q ) y aceptar la hipòtesis alternativa (í7). 

Por tanto, se comprueba nuevamente que deberà aceptarse la propuesta de la Secretaria de Ecologia estatal. 


Anàlisis de varianza para un factor con spss 

Un anàlisis de varianza para un factor mediante el uso del paquete Statistical Package for Social Sciences (spss), 
versión 16.0 para Windows puede elaborarse realizando los pasos siguientes. 

1. Primero se definen las variables de anà¬ 
lisis. 

Retomando el ejemplo anterior, las va¬ 
riables de anàlisis quedarían definidas 
en la ventana de vista de variables ( Va¬ 
riable view) como Estación (1, Prima¬ 
vera, 2, Verano, 3, Otono y 4, Inviemo) 
y Concentración (véase la figura 2.1 del 
editor de spss). 

2. Se capturan los datos en la ventana de 
vista de datos, Data View (véase la figura 2.2). 


|.*J •tno.JÍ 

) ... [OataSoii] sro 0*1* Ullo» 





!• H ( 



wo 




■ Ml 

“ U»» M 

lf » ♦% 
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LM 
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Matmg Columna 

Ngn Maaaura 
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1 0 

EataeiOn 4*1 art© 

(1 Prtm*v»r»> 

Non* 0 

■ Conta» S Seal* 

t [ 

CONCENTRACIÓN Numm 

i 2 

CtncmncMn 6* coctmmr 

>*nt*a Nono 

Ncoa 8 

■ Conta» X Seal* 


Figura 2.1 Variables de anàlisis definidas en la ventana 
de vista de variables (Variable view). 


J •«n·.·o «*. [0*MS*tJ] - tnj 0*1* C4IIO» 


Figura 2.2 Ventana de datos, Data View. 
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3. Se solicita el calculo del anàlisis de varianza para un factor, por tanto, es necesario del menú Analize, sub- 
menú, Compare means, seleccionamos la rutina One-Way ANOVA. .. (véase la figura 2.3). 


tl é anovaO sav [DataS«t2] - SPSS Data Editor 


Cie t* tfew 


Qaía Irarvjform 

^ ^ on ® í 


1 : ESTACIÓN fi 


ESTACIÓN COt 

i 

1 

2 

1 

3 

1 

4 

1 

5 

1 

6 

1 

7 

2 

8 

2 

9 

2 

10 

2 l[ 

11 

2 

12 

2 

13 

3 

14 

3 

16 

3 


Recor; 

Dcïcrpíive StaistKj 

Co*2pere Mtent 

far+rrt trvnw MvM 
ÇorreMe 
Segreswon 
dwafy 

Qata Pecuction 

Sc#e 

ympamiitffrr Tests 
Time Ser es 

Response 

Corcro 


>.ci 

7.44 
2.52 

5.44 
494 


A£t-grs 'í^nòow 

fi <*<*% 


un» 


M . 

• One-Sunele T Tí» 

hdcfxndert-Swacfes T Test 
Jt, ÏM'K·ïmMn ■ i 

F . Qne+Vsy ANOVA... 


Figura 2.3 Calculo del anàlisis de varianza para un factor. 


4. Seleccionamos la variable dependiente (concentra- 
ción de contaminantes) y la variable independiente 
o factor (estación). 

En la sección de opciones (Options...) solicitar 
las estadísticas descriptivas de la variable depen¬ 
diente (véase la figura 2.4). 





Figura 2.4 En la sección de opciones (Options...) solicitar las 
estadísticas descriptivas de la variable dependiente. 


5. Solicitar el calculo mediante OK en la ventana de One-Way Anova para obtener los resultados que se mues- 
tran en la figura 2.5. 


< 

.çç 

c5 

CL 


cu 

o 


o 

Q. 

Ò 


Oneway 

(Processing...) 


[DataSet2] C : \ Documents and Settings \ Alberto Pierdant \ Mis documentos \ A. 

Descriptives 

Concentración de contaminantes 



N 

Mean 

Std. Deviation 

Std. Error 

95% Confidence Interval for 
Mean 

Minimum 

Maximum 

Lower Bound 

Upper Bound 

Primavera 

6 

6.1683 

.63139 

.25776 

5.5057 

6.8309 

5.36 

7.08 

Vera no 

6 

8.0600 

.48839 

.19938 

7.5475 

8.5725 

7.44 

8.80 

Otono 

6 

4.1200 

1.13375 

.46285 

2.9302 

5.3098 

2.52 

5.44 

Invierno 

6 

6.4717 

.43333 

.17691 

6.0169 

6.9264 

6.01 

7.09 

Total 

24 

6.2050 

1.58411 

.32335 

5.5361 

6.8739 

2.52 

8.80 


ANOVA 

Concentración de contaminantes 


o 

cu 


Sum of 

df 

Mean 

F 

Big 

© 


Squares 


Square 



O) 

BetweenGroups 

47.164 

3 

15.721 

29.799 

.000 

Q. 

Within Groups 

10.552 

20 

.528 



O 

Total 

57.716 

23 





Figura 2.5 Calculo mediante OK en la ventana de One-Way Anova. 
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6. A través de este simple procedimiento de calculo podemos obtener un anàlisis de varianza para un factor con 
el paquete estadístico spss. 


Pruebas para la diferencia entre pares de medias 

En el anàlisis de varianza de un factor el resultado de aceptar la hipòtesis nula (H 0 ) nos puede indicar si todas las 
medias en el anàlisis son iguales; sin embargo, cuando se rechaza la hipòtesis nula, este anàlisis no nos indica 
cuàl o cuàles medias son diferentes entre sí. 

Para determinar la diferencia entre dos medias requerimos otras pruebas estadísticas, las cuales consisten en rea- 
lizar una comparación por pares, de todos los pares de medias posibles. 

Si cualesquier valor absoluto de la diferencia entre dos medias muestrales es mayor que algún criterio de compara¬ 
ción, entonces se dice, que esta diferencia es significativa y se concluye que las medias poblacionales respectivas 
son diferentes. 

En estadística existen diversos criterios de comparación de pares de medias, pero en la pràctica los màs utilizados 
son el método de Tukey (léase TooKey) y el de diferencia mínima significativa (dms). 

Ambos métodos se pueden utilizar indistintamente si el número de observaciones en cada muestra o tratamiento 
es el mismo («, = n z = n 3 =... n k ). En estos casos, se dice que estos problemas de anàlisis presentan un diseno de 
anàlisis de varianza balanceado. 

Si el problema de estudio presenta muestras con tamanos diferentes («, ^ n 2 ^ n 3 ï ... ^ n k ), se dice que estos pro¬ 
blemas de anàlisis de varianza presentan un diseno no balanceado y podràn analizarse a través de un método dms 
modificado. 


Prueba de Tukey y de dms para disenos balanceados 

Como indicamos previamente, un diseno balanceado en un anàlisis de varianza indica que todas las muestras del 
anàlisis tienen el mismo número de observaciones. En estos casos el analista puede emplear la prueba de Tukey 
o bien la de dms. Para ilustrar el procedimiento de ambas pruebas utilizaremos el problema 2.1. 


Ejemplo 2.3 

"D 

0) 

Ü La cadena de restaurantes Viks cuenta con cuatro unidades en el sur de la ciudad. El gerente de la zona desea 

I realizar una campana de promoción de juegos y premios entre los comensales para incrementar las ventas. El 

E gerente considera que diferentes juegos y premios atraería a diferentes tipos de consumidores, desde los que 

< 

s tienen ingresos medios hasta los que tienen ingresos altos. Decide utilizar el monto de los consumos como me- 

£ dida representativa del ingreso. Desea determinar si existe diferencia en el nivel promedio de consumo entre las 

.52 

1 cuatro unidades de su zona. Si encuentra alguna diferencia, entonces, ofrecerà mayor diversidad de premios en 

o su campana de promoción. 

3 

Ü 

-3- 


CL 

o 


O 
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Cuadro 2.18 Resumen de datos y las medias de consumo. 


Nota de consumo 

San Àngel 

Tlàhuac 

Taxquena 

Culhuacàn 

1 

510 

190 

360 

130 

2 

490 

190 

420 

150 

3 

560 

210 

450 

90 

4 

480 

240 

480 

100 

5 

380 

210 

390 

190 

6 

510 

310 

410 

150 

7 

480 

250 

510 

210 

Medias 

487.14 

228.57 

431.43 

145.71 


Nota: El total de la nota està en pesos. 


• El cuadro 2.19 muestra un resumen del anàlisis de varianza para un factor de este problema. 


Cuadro 2.19 Anova, resumen del anàlisis de varianza para un factor de este problema. 


Consumo 

Sum ofsquares 

df 

Mean square 

F 

Sig. 

Between groups 

553325.000 

3 

184441.667 

78.090 

0.000 

Within groups 

56685.714 

24 

2361.905 



Total 

610010.714 

27 
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En el cuadro 2.19 el valor p es menor que el valor de a (0.000 < 0.05) por lo que debemos rechazar la hipòtesis 
nula (H 0 ), es decir, los consumos promedio por restaurante son distintos. El siguiente paso consiste en determinar 
cuàles son diferentes. 


Prueba de Tukey para disenos balanceados 

Este método se desarrolló en 1953 por J.W. Tukey y requiere el calculo del criterio de T. Tukey, definido como: 


donde, 


T = Q« 



(2.9) 


q = distribución de rangos elaborada a través de una t de Student con k (tratamientos) y (n — k) grados de 
libertad para un valor a. 

k = número de muestras o tratamientos. 

n = total de datos de todas las muestras. 

r = número de datos por muestra o tratamiento (r debe ser igual en todas las muestras). 

2 

o~ DC = la varianza dentro de muestras (error). 

• El valor q r para un determinado valor de a se puede obtener de la tabla de valores críticos de la dis¬ 
tribución de rangos de Student que se ubica en el anexo de tablas. 

• Si el nivel de signiíicancia deseado es del 5%, entonces el valor q para nuestro problema toma el valor 
siguiente: 

a =39 

v 0.05, 4, 24 J 
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• Del cuadro resumen del anàlisis de varianza para un factor 2.19 obtenemos el valor de la varianza dentro 
de las muestras: 

o 2 dc = 2361.905 

• Sustituyendo valores en la ecuación del criterio de Tukey obtenemos: 


T = q 


a, k, n-k 


o: 


= 3.9 


2361.905 


7 


71.64 


• El criterio T se compara con la diferencia absoluta entre cada par de medias muestrales (véase el cuadro 

2 . 20 ). 


Cuadro 2.20 Criterio 7se compara con la diferencia absoluta entre cada par de medias muestrales. 


SA -Tia 

| 487.14-228.57 | 

= 258.57 

> 

71.64 

SA -Tax 

| 487.14-431.43 | 

= 55.71 

< 

71.64 

SA - Cul 

| 487.14- 145.71 | 

= 341.43 

> 

71.64 

Tia - Tax 

| 228.57-431.43 | 

= 202.86 

> 

71.64 

Tia - Cul 

| 228.57- 145.71 | 

82.86 

> 

71.64 

Tax - Cul 

| 431.43- 145.71 | 

= 285.71 

> 

71.64 


• Se observa que sólo las unidades San Àngel y Taxquena tienen igual nivel de consumo promedio y las otras 
diferencias calculadas exceden el criterio T. 

• En el cuadro 2.21 se muestra la salida de este método mediante el paquete spss. 

Cuadro 2.21 Salida del criterio T mediante el sistema spss, con múltiples comparaciones. 


Consumo Tukey HSD 


(1) Restaurante 

(J) Restaurante 

Mean difference (l-J) 

Std error 

Sig. 

95% Intervalo confidencial 

Lower bound 

Upperbound 

San Àngel 

Tlàhuac 

258.571* 

25.977 

0.000 

186.91 

330.23 


Taxquena 

55.714 

25.977 

0.168 

-15.95 

127.38 


Culhuacàn 

341.429* 

25.977 

0.000 

269.77 

413.09 

Tlàhuac 

San Àngel 

-258.571* 

25.977 

0.000 

-330.23 

-186.91 


Taxquena 

-202.857* 

25.977 

0.000 

-274.52 

-131.20 


Culhuacàn 

82.857* 

25.977 

0.019 

11.20 

154.52 

Taxquena 

San Àngel 

-55.714 

25.977 

0.168 

-127.38 

15.95 


Tlàhuac 

202.857* 

25.977 

0.000 

131.20 

274.52 


Culhuacàn 

285.714* 

25.977 

0.000 

214.05 

357.38 

Culhuacàn 

San Àngel 

-341.429* 

25.977 

0.000 

-413.09 

-269.77 


Tlàhuac 

-82.85* 

25.977 

0.019 

-154.52 

-11.20 


Taxquena 

-285.714* 

25.977 

0.000 

-357.38 

-214.05 


* The mean difference is significant at the 0.05 level 
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• En el cuadro 2.21 se comprueba en la segunda columna (mean difference) que sólo las unidades San Àngel 
y Taxquena no tienen una diferencia significativa en los consumos promedio de sus clientes a un nivel de 
significancia de 0.05. 

• Lo mismo lo comprobamos nuevamente, ya que el valor p es mayor que a (0.168 > 0.05); es decir, se acep- 
ta la hipòtesis nula (medias iguales). 


Prueba de la diferencia mínima significativa (dms) para disenos balanceados 

El método de la diferencia mínima significativa (dms) es similar al método de Tukey, ya que compara el criterio 
dms con la diferencia absoluta calculada con las medias muestrales. 

• Si el diseno està balanceado, el criterio dms es: 

DMS = ^ 2agcFa · 1 ·"- t ' - (2.10) 

donde, 

F = Distribución F con 1 y n-k grados de libertad para un valor a. 
k = Número de muestras o tratamientos. 
n = Total de datos de todas las muestras. 

r = Número de datos por muestra o tratamiento (r debe ser igual en todas las muestras). 
o 2 dc = La varianza dentro de muestras (error). 


• De las tablas o con Excel el valor de F l 94 es de 4.26. 

• Sustituyendo valores en la ecuación 2.10 obtenemos: 

DMS . - ^^61.9050X4.26) _ ^ 

• El criterio se compara con la diferencia absoluta entre cada par de medias muestrales, al igual que el criterio 
T (véase el cuadro 2.22). 


Cuadro 2.22 Diferencia absoluta entre cada par de medias muestrales. 



SA -Tia 

| 487.14-228.57 | 

= 258.57 

> 

53.62 

"D 

CD 

C/3 

SA -Tax 

| 487.14-431.43 | 

55.71 

> 

53.62 

0 

C/3 

ic 

03 

SA-Cul 

| 487.14- 145.71 | 

= 341.43 

> 

53.62 

< 

.55 

Tia - Tax 

| 228.57-431.43 | 

= 202.86 

> 

53.62 

ÇO 

CL 

Tia - Cul 

| 228.57- 145.71 | 

82.86 

> 

53.62 

t5 

LLI 

Tax - Cul 

1 431.43- 145.71 1 

= 285.71 

> 

53.62 


• Se observa en el cuadro 2.22 que ninguna unidad tiene igual nivel de consumo promedio que otra, bajo este 
criterio. Todas las diferencias calculadas exceden el criterio dms. 

• El criterio dms es mas conservador que el valor Tukey. 

• Y al igual que el criterio anterior se puede calcular usando el paquete estadístico spss (véase el cuadro 
2.23). 
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Cuadro 2.23 Consumo Tukey HSD. 

Múltiple Comparisons 


Consumo 

LSD 


(1) 

Restaurante 

(J) 

Restaurante 

Mean 

difference 

(l-J) 

Std error 

Sig. 

95% Intervalo confidencial 

Lower bound 

Upper bound 

San Àngel 

Tlàhuac 

258.571* 

25.977 

.000 

204.96 

312.19 


Taxqueha 

55.714* 

25.977 

.042 

2.10 

109.33 


Culhuacàn 

341.429* 

25.977 

.000 

287.81 

395.04 

Tlàhuac 

San Àngel 

-258.571* 

25.977 

.000 

-312.19 

-204.96 


Taxqueha 

-202.857* 

25.977 

.000 

-256.47 

-149.24 


Culhuacàn 

82.857* 

25.977 

.004 

29.24 

136.47 

Taxqueha 

San Àngel 

-55.714* 

25.977 

.042 

-109.33 

-2.10 


Tlàhuac 

202.857* 

25.977 

.000 

149.24 

256.47 


Culhuacàn 

285.714* 

25.977 

.000 

232.10 

339.33 

Culhuacàn 

San Àngel 

-341.429* 

25.977 

.000 

-395.04 

-287.81 


Tlàhuac 

-82.857* 

25.977 

.004 

-136.47 

-29.24 


Taxqueha 

-285.714* 

25.977 

.000 

-339.33 

-232.10 


* The mean difference is significant at the 0.05 level 
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Prueba dms modificada para disenos no balanceados 

Si el problema de estudio presenta muestras con tamanos diferentes [(«)], n 2 T ^ ... ^ nj , se dice que estos 
problemas de anàlisis de varianza presentan un diseno no balanceado y únicamente podran analizarse mediante 
un método dms modiíicado. 

• En el método dms modiíicado para comparar las muestras /-ésima y /-és i ma, el criterio de comparación dms 
se modifica a: 

DMS itj = 

donde, 

F = Distribución F con k— 1 y n-k grados de libertad para un valor a. 
k = Número de muestras o tratamientos. 
n = Total de datos de todas las muestras. 
r = Número de datos para la muestra o tratamiento /-ésima. 


1 1 

—+ — 


o F 

u DC 1 a,k-\,n-k 


( 2 . 11 ) 
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r = Número de datos para la muestra o tratamiento j-é sima. 

2 

°dc = La varianza dentro de muestras (error). 

• El criterio dms modificado serà diferente para cada par de comparaciones de medias, debido a que el núme¬ 
ro de observaciones no es el mismo en cada muestra. 


Ejemplo 2.4 

Suponga un anàlisis de varianza para tres tratamientos cuyas muestras tienen di¬ 
ferente tamano (véase el cuadro 2.24). Determine si las muestras tienen la misma 

Datos 

Cuadro 2.24 

Tratamientos 

1 II 

III 

media. Si no tienen la misma media cuàles pares son iguales. 

1 

30 

38 

19 


2 

25 

32 

35 


3 

31 

35 

20 


4 

35 

36 

22 

Solución 

5 


38 

25 

• Suponiendo que a = 0.05, entonces de tablas o con Excel, F q05 = 3.89. 

La salida One-Way Anova del paquete spss se muestra en el cuadro 2.25. 

6 

Medias 

30.25 

32 

35.17 

24.20 


Cuadro 2.25 Salida One-Way Anova del paquete spss. 


Datos 

Sum of squares 

df 

Mean square 

F 

Sig. 

Between groups 

328.017 

2 

164.008 

7.737 

0.007 

Within groups 

254.383 

12 

21.199 



Total 

582.400 

14 





< 

.çg 

c5 

CL 


o 

Q. 


0 


CL 

o 


O 


• Puesto que la F calculada (7.737) es mayor que la F de tablas (3.89), debemos rechazar la hipòtesis nula, 
es decir, las medias de los tratamientos son distintas. Este resultado se confirma a través del valor p, ya que 
p es menor que a (0.007 < 0.05). 

• Como las medias de los tratamientos son diferentes, entonces nos resta analizar que pares de ellas son igua¬ 
les (/-//, /-/// y //-///). Pero observamos que el número de datos “r” en cada una de ellas es distinto por lo 
que deberemos aplicar una prueba dms modificada para disenos no balanceados. 

• Si a = 0.05 y F (j (| . 3) = 3.89, la comparación I-1I para dms modificada es: 


DMS, „ = 


1 1 

-1- 

4 6 


(21.199)(3.89) = 5.86 


La comparación /-///para dms modificada es: 

DMS L1II = 


1 1 

-1- 

4 5 


(21.199X3.89) = 6.09 


La comparación //-/// para dms modificada es: 

DMS,, = 


1 1 

-1- 

6 5 


(21.199X3.89) = 5.49 

La diferencia entre medias comparada con su dms modificado se muestra en el cuadro 2.26. 
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Cuadro 2.26 Diferencia entre medias comparada con su dms modificado. 


1 - II 

| 30.25-35.17 | 

= 4.92 

< 

5.86 

1 - III 

| 30.25-24.20 | 

= 6.05 

< 

6.09 

II - III 

| 35.17-24.20 | 

= 10.97 

> 

5.49 


• Sólo el tratamiento II y III difieren significativamente, el resultado también se puede obtener mediante el 
paquete spss (véase el cuadro 2.27). 


Cuadro 2.27 Los tratamientos II y ///difieren significativamente. 


Datos LSD 





95% Confidence interval 

(l)Tratamiento 

(ll)Tratamiento 

Mean difference (l-J) 

Std. error 

Sig. 

Lower bound 

Uperbound 

1 

II 

-4.91667 

2.97200 

0.124 

-11.3921 

1.5588 


III 

6.05000 

3.08859 

0.074 

-0.6795 

12.7795 

II 

1 

4.91667 

2.97200 

0.124 

-1.5588 

11.3921 


III 

10.96667* 

2.78798 

0.002 

4.8922 

17.0411 

III 

1 

-6.05000 

3.08859 

0.074 

-12.7795 

0.6795 


II 

-10.96667* 

2.78798 

0.002 

-17.0411 

-4.8922 


Anàlisis de varianza con dos factores 

En el anàlisis de varianza para un factor se considera que sólo un factor influye en las unidades experimentales; 
sin embargo, con frecuencia se observa que un segundo factor exterior puede influenciar el comportamiento de 
estas unidades experimentales. 

Un anàlisis estadístico que considera simultàneamente ambos factores recibe el nombre de anàlisis de varianza 
con dos factores (Two-Way Anova). 

Por ejemplo, el Gobiemo del Distrito Federal cuenta con tres tipos de màquinas para colocar el asfalto en las 
calles de la ciudad. 

1 Se desea comparar la productividad promedio (km/día) de las tres màquinas de asfalto (tratamientos); sin embar- 

Cl) 

s> go, el ingeniero de campo se da cuenta que al probarlas la destreza del operador y su experiencia pueden afectar el 

</) 

% número de kilómetros por día asfaltados, lo que produce una confusión sobre cuàl màquina es realmente mejor. 

< 

a Para obtener un panorama no contaminado y màs claro sobre la productividad de cada màquina se debe eliminar 

<2 o corregir de alguna manera la influencia del operador sobre la productividad final de cada equipo. Esta conside- 

! ración simultànea de dos factores (màquina y operador) requiere un anàlisis de varianza con dos factores. 

1 o 
LD 

| Para solucionar este problema y realmente obtener una medida de la capacidad de poner asfalto de estas màqui- 

P nas, debemos bloquear el factor externo (el operador), colocando las observaciones en grupos homogéneos con 

8 base, por ejemplo, en los anos de experiencia que tiene cada operador (la màquina de asfalto 1 con los operadores 

© 

£ que tienen 1 ano de experiencia, otro con los que tienen 2 anos, y así sucesivamente. Por tanto, las observaciones 

| se clasifican por bloques (anos de experiencia) y por tratamientos (màquinas). El propósito del bloqueo es redu- 

cir la variación dentro de un tratamiento. A este diseno experimental se le conoce como diseno cileatorizcido en 
bloques. 
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Si los bloques se elaboran adecuadamente con base en un factor (la experiencia) que verdaderamente afecte la 
productividad se obtiene una medición mas precisa del efecto del tratamiento; sin embargo, si el factor seleccio- 
nado para el bloqueo no es el adecuado, los resultados pueden ser enganosos; por tanto, es importante seleccionar 
adecuadamente el factor de bloqueo para garantizar que sí tenga cierto impacto. 

Para mostrar el procedimiento de calculo de un anàlisis de varianza con dos factores usaremos el problema 2.3. 

Ejemplo 2.5 

El Banco de Comercio trata de seleccionar tres nuevos sistemas de computo para mejorar la calidad de la atención 
de sus clientes. La selección final del sistema dependerà de su productividad (clientes atendidos por hora). Por 
tanto, se seleccionan aleatoriamente cinco cajeros para cada sistema y los tres proveedores de los sistemas le in- 
dican al banco que, para un manejo adecuado de sus sistemas considere la experiencia de sus cajeros en la prueba 
del sistema, ya que este factor puede afectar el resultado en la productividad de su respectivo sistema. 

La gerencia de sistemas desea evaluar el impacto de la experiencia de los cajeros en la selección del sistema de 
atención de clientes. En una prueba de los sistemas, el número de clientes por hora en cada sistema se muestra 
en el cuadro 2.28. 
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Cuadro 2.28 Evaluación del impacto de la experiencia 
de los cajeros en la selección del sistema de atención de clientes. 


Sistema de atención a clientes (tratamiento) 

Anos de experiencia del cajero Oracle (clientes/hora) Total (clientes/hora) Adabas (clientes/hora) 

1 

25 

21 

27 

2 

35 

33 

31 

3 

39 

39 

42 

4 

37 

41 

38 

5 

45 

46 

45 


Dentro de una muestra (tratamiento) dada se observarà una variación en la productividad (clientes/hora) debido 
a la experiencia del cajero, la capacitación recibida y otros factores de error aleatorios. Pero el banco, no està 
interesado en la productividad de los cajeros, sino en la productividad del sistema de atención a clientes, por lo 
que se debe ajustar la productividad del cajero para eliminar su efecto de variabilidad y obtener así, una medida 
precisa de la calidad del sistema. 

Anàlisis de varianza con dos factores (diseno aleatorizado en bloques) 

En el anàlisis de varianza con dos factores, la suma de cuadrados total se divide en tres partes: 

• La suma de cuadrados entre muestras (tratamientos) (scm). 

• La suma de cuadrados dentro de las muestras (scdm). 

• Suma de cuadrados de bloques (scb). 

Por tanto la suma de cuadrados total (sct) serà: 

SCT = SCM + SCDM + SCB (2.12) 

La suma de cuadrados total (sct) y la suma de cuadrados entre muestras (scm) se calculan de la misma forma 
que en el anàlisis de varianza para un factor; sin embargo, la suma de cuadrados dentro de las muestras (scdm) se 
subdivide en una medida para scdm y otra para la suma de cuadrados de bloques (scb). 
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La suma de cuadrados de bloques se define como: 

k . _. 

SCfl = £jfc(z,. -X| 2 (2.13) 

i =1 

donde, 

k = número de muestras o tratamientos: 

X = medio del í-ésimo bloque i = 1, 2, 3, b. 

X = la gran media. 

Para nuestro problema de ANOVA con dos factores, el calculo de la suma de cuadrados de bloques se muestra 
en el cuadro 2.29. 


Cuadro 2.29 ANOVA con dos factores. 

Sistema de atención a clientes (tratamiento) 


Anos de experiencia 

Oracle (clientes 

Total (clientes 

Adabas 

x f 


del cajero 

/hora) 

/hora) 

(clientes/hora) 

k(r -r)‘ 

1 

25 

21 

27 

24.33 

427.21 

2 

35 

33 

31 

33.00 

32.01 

3 

39 

39 

42 

40.00 

41.81 

4 

37 

41 

38 

38.67 

17.28 

5 

45 

46 

45 

45.33 

246.61 


X 

36.267 


SCB = 

764.93 
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• La suma de cuadrados de bloques mide el grado de variación de las medias del bloque (filas) alrededor de 
la gran media. 

• La suma de cuadrados entre muestras (scm) se calcula con el numerador de la ecuación (2.5): 

SCM = f j n J (x j -ï) 2 (2.5) 

j =i 

• Los resultados del calculo de la scm para el problema se muestran en el cuadro 2.30. 

• Por otro lado se calcula la suma de cuadrados totales (sct) con la ecuación (2.14). 

= (V f ) 2 (2-14) 

;=i /=i 

Para i = 1, 2, 3, ... k tratamientos. 
j= 1, 2, 3, ... b bloques. 

SCT= (25 - 36.267)= + (21 - 36.267)= + (27 - 36.267)= + (35 - 36.267)= + (33 - 36.267)= 

+ (31 - 36.267)= + ... + (45 - 36.267)= = 806.93 
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Cuadro 2.30 Resultados del calculo de la scm. 
Sistema de atención a clientes (tratamiento) 


Anos de experiencia del cajero 

Oracle (clientes por hora) 

Total (clientes por hora) 

Adabas (clientes por hora) 

1 

25 

21 

27 

2 

35 

33 

31 

3 

39 

39 

42 

4 

37 

41 

38 

5 

45 

46 

45 


36.2 

36.0 

36.6 

n,(x-X) 2 

0.0222 

0.3556 

0.5556 

SCM = 0.933 


• La suma de cuadrados dentro de las muestras (scdm) se calcula como: 

SCDM = SCT - SCM - SCB (2.15) 

scdm = 806.93 - 0.9333 - 764.93 = 41.07 

• En 2.15 hay b bloques y k tratamientos; es decir, hay n = bk observaciones. 

• Los grados de libertad para cada una de las sumas de cuadrados son: 

SCDM = SCT - SCM - SCB 


(.b - 1 ){k —Y) = (n — Y) — (k—Y) — (b — \) 

• Para el problema, los grados de libertad para cada una de las sumas de cuadrados son: 
(5 - 1)(3 - 1) = (15 - 1) - (3 - 1) - (5 - 1) 

8 = (14)-(2)-(4) 


El cuadrado medio entre muestras (varianza de la media entre muestras), lo mismo que el Anova de un 
factor son la suma de sus cuadrados dividido entre sus grados de libertad. 

2 SCM 

o~ = - 

£c jfc-1 


(2.15) 


Para el problema: 


0.9333 

3-1 


= 0.467 


• En el anàlisis de varianza con dos factores, la varianza dentro de las muestras està definida como: 


• Para el problema: 


SCDM 

(b-\)(k-\) 


(2.16) 


a 


DC 


41.07 

(5-1X3-1) 


5.133 


Y la varianza entre bloques (cuadrado medio del bloque) o~ b se calcula con la ecuación 2.17. 

SCB 


ol = 


Para el problema: 


°l = 


b -1 
764.93 


5-1 


(2-17) 


= 191.233 
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Prueba de hipòtesis para Anova con dos factores mediante el estadístico F 

Una vez que contamos con las tres estimaciones de la varianza de la población, el siguiente paso es compararlas 
mediante el calculo de los cocientes siguientes: 


Varianza entre las medias muestrales ( o 2 EC ) 
Varianza dentro de las muestras (o 2 DC ) 
Varianza entre bloques (o 2 b ) 

Varianza dentro de las muestras ( o 2 DC ) 


(2.18) 

(2.19) 


Estos cocientes calculan un estadístico F para probar la hipòtesis de que las medias entre tratamientos son iguales 
( F), y que las medias entre los bloques son iguales (Fj. 

Si las medias entre los bloques (íilas) son iguales (el promedio de operaciones en caja es similar independiente- 
mente de la experiencia de los cajeros), entonces este factor no es determinante para explicar el comportamiento 
de la variable dependiente (promedio de operaciones en caja por hora) es decir, primero debemos realizar una 
prueba de hipòtesis para íilas. Por tanto, para nuestro problema, la hipòtesis a probar es: 


h 0 ·F í =F 2 = ·~F 5 


• La media de operaciones en cada caja (operaciones por hora) es similar sin importar los anos de experien¬ 
cia de los cajeros en sistemas. 

H !=/«, */i 2 *...fi s 

• Las medias de operaciones en cada sistema son distintas y dependen de cuàntos anos de experiencia tenga 
el cajero en el manejo de sistemas. 


• Obtenemos el valor de F 2 para realizar la prueba de hipòtesis por bloques (íilas). 


f 2= 



191.233 

5.133 


37.255 


• Si deseamos probar la hipòtesis a un nivel de signiíicancia del 5%, entonces el valor de F, deberà bus- 
carse en tablas o bien calcularse con ayuda de Excel, con (b -1) grados de libertad en el numerador y 
(.b — \)(k -1) grados de libertad en el denominador: 


• Con: 


2(0.05, 4, 8) 


3.84 


• Obtenemos un valor de: 


Excel, =distr.f.inv(0.05, 4, 8) 


3.8379 


• Nuestra regla de decisión en este caso seria: 

NO rechazar la hipòtesis nula (// ), si F, < 3.84. 

Rechazarla, si F, >3.84. 

• Debido a que F 2 calculada (F = 37.255) es mayor que el valor en tabla (3.84) debemos rechazar la hipòtesis 
nula y quedamos con la hipòtesis alternativa H \ es decir, la media de operaciones en cada caja (operacio¬ 
nes por hora) realizadas en los diferentes sistemas son distintas y dependen de los anos de experiencia que 
tenga el cajero en el manejo de sistemas. 
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• Debido a que el factor anos de experiencia en sistemas es un elemento importante, entonces se procede a 
realizar un segundo anàlisis (Two-Way Anova) sobre los datos. 

• Si el resultado de esta primera prueba nos hubiera indicado que debemos aceptar la hipòtesis nula, entonces 
el analista deberà replantear su problema y realizar un anàlisis de varianza de un factor. 

• Por tanto, para el problema de estudio, significaria que el factor experiencia del cajero en sistemas no es 
importante y que no es necesario crear los bloques de datos por anos de experiencia. 

• Ahora bien, como el factor bloqueado afecta los datos del problema, entonces el analista deberà realizar 
una segunda prueba de hipòtesis. 

• Por tanto, para nuestro problema, como la experiencia del cajero en sistemas sí afecta el número de opera- 
ciones por hora, se probarà ahora una segunda hipòtesis: 

El número de operaciones que se pueden manejar por hora en cada sistema es igual siempre y cuando los cajeros 
que prueban cada sistema tengan los mismos anos de experiencia. 


• Es decir, el número promedio de operaciones en cada sistema es similar, por lo que el banco puede selec¬ 
cionar cualquiera de ellos una vez hecha la consideración de los anos de experiencia en sistemas que tiene 
el cajero. 

• Este segundo anàlisis tiene como objetivo probar: 

H () : /u i =/u 2 = /u \ es decir, la media de operaciones (operaciones por hora) es similar en cada sistema. 
HyH x ^/u 2 ^/u 3 \ es decir, las medias de operaciones son distintas en cada sistema. 


Para probar esta segunda hipòtesis, obtenemos el valor de F que permite realizar una prueba de hipòtesis 
por tratamientos (columnas). 

Varianza entre las medias muestrales ( o 2 EC ) 

Varianza dentro de las muestras (o DC ) 


(ai) = O467 = 0091 
1 (o 2 dc ) 5.133 


• Si deseamos probar esta segunda hipòtesis a un nivel de significancia de 5%, entonces el valor de F de¬ 
berà buscarse en tablas o calcularse con ayuda de Excel con (k — \) grados de libertad en el numerador y 
(b - 1) (k — 1) grados de libertad en el denominador: 

F =4 46 

1(0.05,2,8) 

• Con Excel, =distr.f.inv(0.05, 2,8): 

Obtenemos un valor de 4.459 

• Nuestra regla de decisión en este segundo caso seria: 

NO rechazar la hipòtesis nula (Fí 0 ) si F < 4.46. 

Rechazarla si F > 4.46. 

• Debido a que F calculada (F = 0.091) es menor que el valor en tablas (4.46) debemos aceptar la hipòtesis 
nula; es decir, la media de operaciones en cada sistema (operaciones por hora) son iguales siempre y cuan¬ 
do los cajeros cuenten con los mismos anos de experiencia en la operación de sistemas. 

• Con base en esto, el banco puede decidir comprar cualquiera de los sistemas que le han presentado sus 
proveedores. 
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Cuadro resumen del anàlisis de varianza con dos factores 

Al igual que en el anàlisis de varianza para un factor, estos càlculos del Anova con dos factores y el formato del 
cuadro para anàlisis se pueden resumir en el cuadro 2.31. 


Cuadro 2.31 Càlculos del ANOVA con dos factores. 

Fuente 

Suma 

de cuadrados 

Grados 
de libertad 

Varianza 
de lamedia 

F 

p 

Entre muestras (tratamientos) 

SCM 

/r-1 

<4 

K) 

K) 

Significancia (sig.) 

Entre bloques 

SCB 

b -1 


i°i) 

«) 

Significancia (sig.) 

Dentro de muestras (error) 

SCDM 

(b-1) (/r-1) 

° 2 dc 



Variación total 

SCM + SCB + SCDM 

n-1 




Nota: n= n^ + n 2 + ... n k , suma del número de datos de todas las muestras. 

K= número de muestras o tratamientos. b= número de bloques. 


• Para nuestro problema el cuadro resumen del anàlisis de varianza con dos factores se muestra en el cuadro 
2.32. 


Cuadro 2.32 

Resumen del anàlisis de varianza con dos factores. 



Fuente 

Suma 

de cuadrados 

Grados 
de libertad 

Varianza 
de la media 

F 

P 

Entre muestras (tratamientos) 

0.933 

2 

0.467 

0.091 

0.914 

Entre bloques 

764.93 

4 

191.233 

37.255 

0.000 

Dentro de muestras (error) 

41.07 

8 

5.133 



Variación total 

806.93 

14 





En el cuadro 2.33, resultado del proceso con spss, se muestra el resumen del anàlisis de varianza con dos factores 
y el càlculo del estadístico p para ambas pruebas de hipòtesis. 

Cuadro 2.33 Test of between-subjects effects. 


Dependent variable: Número de operaciones bancarias por hora 


Source 

Type III Sum 
of squares 

df 

Mean Square 

F 

Sig. 

Sistema 

Hypothesis 

.933 

2 

0.467 

.091 

.914 


Error 

41.067 

8 

5.133 a 



Experiència 

Hypothesis 

764.933 

4 

191.233 

37.253 

.000 


Error 

41.067 

8 

5.133 a 



Sistema * Experiència 

Hypothesis 

41.067 

8 

5.133 




Error 

.000 

0 

b 




a MS(Sistema * Experiència) 
b - MS(Error) 
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Para la primera hipòtesis del problema: 

• El valor p es menor que alfa (0.000 < 0.05). 

• Por lo que debe rechazarse la hipòtesis nula. 

• La experiencia sí tiene significancia en el manejo de los sistemas. 

• Con esto se corrobora el resultado encontrado con la prueba F,. 

Por otro lado, para la segunda hipòtesis del problema: 

• El valor p es mayor que alfa (0.914 > 0.05). 

• Por lo que debe aceptarse la hipòtesis nula. 

• Es decir, el promedio de operaciones por hora es similar en cualquiera de los sistemas si se consideran 
cajeros con la misma experiencia (véase el cuadro 2.32). 

Ejemplo 2.6 

La Dirección de Recursos Humanos (RH) 
de BIMBO està probando un nuevo siste¬ 
ma de evaluación para sus gerencias en una 
planta de la Ciudad de México, en el que se 
considera una escala de calificación de 10 
a 50 puntos. Se seleccionan aleatoriamente 
cinco empleados de la planta y se les pide 
que evalúen la actuación de los gerentes de 
producción, finanzas, mercadotecnia y al- 
macenes ( véase el cuadro 2.34). 

• La dirección de RH desea saber si existen diferencias en las calificaciones promedio de los cuatro gerentes. 

• Sospecha que el sistema permite a todos los empleados evaluar igual a todos los gerentes por lo que decide 
realizar un anàlisis de varianza con dos factores. 

Solución 

• Calculamos primero la suma de cuadrados de bloques (SCB) como se muestra en el cuadro 2.35. 


Cuadro 2.34 Evaluación para las gerencias en la planta BIMBO. 


Gerente (tratamiento) 

Empleado 

Producción 

Finanzas 

Mercadotecnia 

Almacenes 

1 

38 

35 

31 

46 

2 

36 

32 

29 

45 

3 

20 

17 

13 

37 

4 

39 

38 

28 

50 

5 

20 

20 

14 

40 


Cuadro 2.35 Suma de cuadrados de bloques (SCB) 


Gerente (tratamiento) 


Empleado 

Producción 

Finanzas 

Mercadotecnia 

Almacenes 

xi 

k(x-ïY 

1 

38 

35 

31 

46 

37.50 

148.84 

2 

36 

32 

29 

45 

35.50 

67.24 

3 

20 

17 

13 

37 

21.50 

372.49 

4 

39 

38 

28 

50 

38.75 

216.64 

5 

20 

20 

14 

40 

23.50 

249.64 




X 

31.4 

SCB = 

1054.30 


• Calculamos la suma de cuadrados entre muestras (SCM) con el numerador de la ecuación 2.5 (véase el 
cuadro 2.36). 
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Cuadro 2.36 Suma de cuadrados entre muestras (scm). 

Gerente (tratamiento) 


Empleado 

Producción 

Finanzas 

Mercadotecnia 

Almacenes 

1 

38 

35 

31 

46 

2 

36 

32 

29 

45 

3 

20 

17 

13 

37 

4 

39 

38 

28 

50 

5 

20 

20 

14 

40 


30.6 

28.4 

23 

43.6 


3.2 

45 

352.8 

744.2 



SCM = 

1145.2 



• Se calcula la suma de cuadrados totales (sct) con la ecuación (2.14). 

sct= (38 - 31.4) 2 + (35 - 31.4) 2 + (31 - 31.4) 2 + ... + (40 - 31.4) 2 = 2284.8 

• Se calcula la suma de cuadrados dentro de las muestras (scdm) como: 

SCDM = SCT - SCM - SCB 

scdm = 2284.8 - 1145.2 - 1054.30 = 85.3 

• El resumen del anàlisis de dos factores para este problema queda definido en el cuadro 2.37. 


< 

.çg 

c5 

CL 


o 

Q. 


0 


CL 

o 


O 



Cuadro 2.37 

Resumen del anàlisis de dos factores. 



Fuente 

Suma de cuadrados Grados de libertad Varianza de la media 

F 

P 

Entre muestras 
tratamientos 

1145.2 

3 381.73 

53.70 

0.000 

Entre bloques 

1054.3 

4 263.58 

37.08 

0.000 

Dentro de muestras 
(error) 

85.3 

12 7.11 



Variación total 

2284.8 

19 




• En principio el director desea saber si hay una diferencia significativa entre las calificaciones promedio que 
han dado cada uno de los cinco empleados (filas). 

• Las hipòtesis en este caso son: 

h 0 ·f i =f 2 = ~·v 5 

• La media de calificación de cada empleado es similar. 

• Las medias de calificación de cada empleado son distintas. 

• El analista desea utilizar un nivel de significancia de 5%, entonces el valor F, buscado en tablas o calculado 
con Excel es: 

F 2(0.0 5 .4,12> = 3.26 

• Con Excel: 

=distr.f.inv( 0.05, 4, 12), obtenemos un valor de 3.2592 
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• Nuestra regla de decisión en este caso seria: 

NO rechazar la hipòtesis nula (H Q ) si F 0 < 3.26. Rechazarla si F n > 3.26. 

• Debido a que F 0 calculada (F = 37.08) es mayor que el valor en los cuadros (3.26) debemos rechazar la hi¬ 
pòtesis nula y quedarnos con la hipòtesis alternativa H , es decir, la media de caliíicación de cada empleado 
es distinta y requerimos de un bloqueo del factor. 

• Ahora bien, como el factor bloqueado afecta los datos del problema, entonces el analista debe proceder a 
realizar una segunda prueba de hipòtesis (Two-Way Anova). 

• El director puede probar la hipòtesis inicial respecto a que las califlcaciones promedio recibidas por las 
gerencias son similares. 

HffPi =A 2 = -A 4 

• La media de caliíicación de cada gerencia es similar en este sistema de evaluación. 

H l :n l */i 2 *p 3 ...p 4 

• Las medias de caliíicación de cada gerencia son distintas en este sistema de evaluación. 

• El analista debe buscar a un ni vel de significancia de 5%, el valor F en tablas o calcularlo con Excel. 

F = 3 49 

1(0.05,3,12) 

• Con Excel: 

=distr.f.inv( 0.05, 3, 12), obtenemos un valor de 3.4903 

• Nuestra regla de decisión en este segundo caso seria: 

NO rechazar la hipòtesis nula (H ) si F < 3.49. Rechazarla si F > 3.49. 

• Debido a que F calculada (F = 53.70) es mayor que el valor en tablas (4.49) debemos rechazar la hipòtesis 
nula; es decir, las medias de caliíicación de cada gerencia son distintas en este sistema de evaluación. 

Anàlisis de varianza con dos factores mediante spss 

Un anàlisis de varianza con dos factores (Two-Way Anova) mediante el uso del paquete Statistical Package for 
Social Sciences (spss) versión 16.0 puede elaborarse realizando los pasos siguientes: 

1. Primero se definen las variables de anàlisis, al retornar el ejemplo anterior, las variables de anàlisis quedarían 
definidas en la ventana de vista de variables (variable view) como: 

Empleado (I, II, III, IV y V), Gerencia (1, Producción; 2, Finanzas; 3, Mercadotecnia y 4, Almacenes) y Ca- 
lificación del empleado a cada gerencia (véase la figura 2.6 del editor de spss). 


I&I anova2fej sav [DataSet2] - SPSS Data Editor 

£•» (dl trvnfwn ir+vt* 

iJMv j Add^r>« ►**> 




E ** M 

<IÉ *<*% 




Name Type 

Width Dec... Label 

Vàlues 

Missing Columns Align 

Measure 


1 Empleado 1 Numèric 1 0 Empleado {1.1}... None 8 * Center # Scale 

2 | Gerencia Numèric 1 0 Gerencia a evaluar. (1, Producción... None 8 SCenter ✓ Scale 

3 Calificacion Numèric 2 0 Calificación None None 8 9 Center / Scale 



✓ Scale 
t Scale 
f Scale 


Figura 2.6 Variables de anàlisis. 
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2. Se capturan los datos en la ventana de vista de datos (Data View), como lo muestra la figura 2.7. 

3. Se solicita el calculo del anàlisis de varianza con dos factores, para ello, del menú Analize, submenú, Gene¬ 
ral Linear Model, seleccionamos la rutina Univariate... (véase la figura 2.8). 


& anovaZfej.sav [DataSetZ] - SPSS Data Editor 1 

D» C<* Qtfa Irmifcrm i« 

•j/mtn ipbej MtLgm v*raj~ U* 



ES h 

üfr M 

ilíi sn v*% 


1 E"CW»J 






Empleado 

Gerencia 

Calificación 

var 

1 

i i 

1 

38 


2 

1 

2 

36 


3 

1 

3 

31 


4 

1 

4 

46 


5 

2 

1 

36 


6 

2 

2 

32 


7 

2 

3 

29 


8 

2 

4 

46 


9 

3 

1 

20 


10 

3 

2 

17 


11 

3 

3 

13 


12 

3 

4 

37 


13 

4 

1 

39 


14 

4 

2 

38 


16 

4 

3 

28 


16 

4 

4 

60 


17 

5 

1 

20 


18 

6 

2 

20 


19 

6 

3 

14 


20 

6 

4 

40 



Figura 2.7 Captura de los datos en la ventana de 
vista de datos. 


i 

anova2fej. sav [DataSetZ] 

- SPSS Data Editor 

File Edit View Data Transform 

Analyze Graphs Utilities Add-ons Wjndow Help 


& i 


fi Er 


1 : Empleado |l 


Empleado G< 

i 

1 ■ 

2 

1 

3 

1 

4 

1 

5 

2 

6 

2 

7 

2 

8 

2 

9 

3 

10 

3 

11 

3 

12 

3 

13 

4 

14 

4 


Resorts 

Descriptive Statistics 
Compare Means 
General Linear Model 
Çorrelate 
Regression 
Classify 
Data Reduction 
Scale 

Nonparametric Tests 
Time Series 
Múltiple Response 
Quality Control 
\T\ ROC Curve... 


T3“ 

37 
39 

38 


5 



lem Univariate... 

ll — 



























Figura 2.8 Calculo del anàlisis de varianza con dos factores. 


4. Seleccionamos la variable dependiente (Calificación de la gerencia), la variable independiente o factor fijo 
(Gerencia) y el segundo factor o factor aleatorio (Empleado) como se muestra en la figura 2.9. En la sección 
de Modelo (Model. ..) eliminar el calculo de la intersección (Include intercept in model). 
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Figura 2.9 Se selecciona la variable dependiente, la independiente o factor fijo y el segundo factor o factor aleatorio. 
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5. Solicitar el calculo mediante OK en la ventana de Univariate para obtener los resultados del anàlisis de 
varianza con dos factores (véase el cuadro 2.38). 

Cuadro 2.38 Se solicita el calculo mediante OKe n la ventana de Univariate. 

Between Subjets Factors 



Value label 

N 

Gerencia a evaluar 1 

Producción 

5 

2 

Finanzas 

5 

3 

Mercadotecnia 

5 

4 

Almacenes 

5 

Empleado 1 

1 

4 

2 

II 

4 

3 

III 

4 

4 

IV 

4 

5 

V 

4 


Test of between subjets effects 

Dependent variable: calificación 


Source 


Type III Sum 
or squares 

df 

Mean square 

F 

Sig. 

Gerencia 

Hypothesis 

1145.200 

3 

381.733 

53.702 

0.000 


Error 

85.300 

12 

7.108 a 



Empleado 

Hypothesis 

1054.300 

4 

263.575 

37.080 

0.000 


Error 

85.300 

12 

7.108 a 



Gerencia * Empleado 

Hypothesis 

85.300 

12 

7.108 




Error 

0.000 

0 

b 




a MS(Gerencia * Empleado). 
6 MS(Error). 
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Anàlisis de factores 

El anàlisis de factores es un procedimiento estadístico fundamentado en el anàlisis de varianza, por lo que esta 
herramienta estadística permite probar simultàneamente el efecto de dos factores; es decir, evaluar dos factores 
de interès al mismo tiempo. 

En el anàlisis de varianza con dos factores, uno es bloqueado durante el procedimiento de càlculo para eliminar 
su impacto, pero en el anàlisis factorial, como ya indicamos, ambos factores son evaluados al mismo tiempo, 
ninguno es bloqueado ya que nos interesa medir el impacto de ambos. 

En el anàlisis factorial se debe efectuar una prueba de efectos principales por cada factor. Esta prueba se aplica 
sobre ambos factores para determinar si los niveles diferentes del factor influyen en las unidades de manera di¬ 
versa. Si no se encuentran efectos principales para un factor, la hipòtesis nula no debe rechazarse. 

En este tipo de anàlisis, cada factor tiene màs de un nivel. Si A y B son los factores de interès, entonces A tiene 
“a” niveles y B, “b” niveles. 

Por ejemplo, si el factor A tiene 3 niveles (I, II y III) y el B 3 (1,2 y 3), entonces se tiene un diseno factorial 3x3. Cada 
combinación (celda) se denomina como un tratamiento (véase el cuadro 2.39). 
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Cuadro 2.39 Cada combinación (celda) se denomina como un tratamiento. 


Factor B 

1 

2 

3 

dato 

dato , 2 , 

dato l3 , 

dato „2 

dato ,22 

dato ,32 

dato „3 

dato ,23 

dat °i33 




dato,„, 

da to „2, 

da tO „3i 

Factor A 

II 

dat0 1112 

dat0 1,22 

dat0 „32 



dat0 ,M3 

dat0 1,23 

dat0 „33 








dato mi, 

dat0 ,1,21 

dat0 „,31 


III 

dat0 „,i2 

dat0 „,22 

dat0 ,1,32 



dat0 „,13 

dat0 ,1,23 

dat0 „,33 


i = I, II y III para el factor A 

j = 1, 2 y 3 para el factor B 

k = número de observación dentro de 
la celda, k = 1,2,3, .... r 


< 

.çg 

c5 

CL 


o 

Q. 


0 


CL 

o 


O 


• Para realizar el anàlisis factorial, debe aparecer mas de una observación (dato) en cada celda. 

• El número de observaciones dentro de una celda se denomina número de replicaciones “r”. 

• En el método que se describe en este libro cada celda debe tener el mismo número de observaciones. 

• Un número desigual va mas allà del alcance de este texto. 

En este método se puede identificar toda interacción que pueda presentarse entre los dos factores y dicha inte- 
racción seria imposible detectaria si los experimentos se realizaran por separado o si cada celda tuviera sólo una 
observación. 

Se dice que la interacción existe si un nivel del factor A funciona de manera diferente (mejor o peor) con niveles 
diferentes del factor B. Esta interacción puede detectarse analizando las diferencias promedio entre los niveles de 
un factor en relación con los niveles diferentes del otro factor. 

Si estas diferencias promedio son las mismas en todos los niveles de ambos factores, no existe interacción y, se 
dice que los efectos de estos factores son aditivos. 

Un método màs preciso para detectar la interacción consiste en aplicar prueba de hipòtesis y se pueden identificar 
tres hipòtesis que deben probarse: 

W fl : Las medias de las filas son iguales (prueba de efectos principales del factor 1 (A)). 

W 0 : Las medias de las columnas son iguales (prueba de efectos principales del factor 2 (B)). 

Hj No hay interacción presente. 

Las hipòtesis alternativas ( H { ) para cada prueba se plantean al contrario: 

• Al igual que el anàlisis de varianza para un factor y con dos factores, este método permite desglosar las sumas 
de cuadrados y construir la tabla factorial para probar las hipòtesis. 

• El anàlisis factorial tiene la ventaja de ser menos costoso. 

• Se pueden estudiar dos factores en un solo experimento en lugar de realizar dos pruebas independientes. 
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Ejemplo 2.7 

El programa del doctorado en Ciencias Sociales de la uam-x realiza un examen de aptitudes de 70 puntos (el mí- 
nimo aceptable es de 25) a candidatos que tienen licenciatura en Sociologia, Ingeniería y Comunicación Social, 
para determinar los candidatos idóneos. 

Para presentar este examen, la universidad imparte tres programas de capacitación: 

Revisión de conocimientos en 20 horas, un seminario de una semana (40 horas) y un curso propedéutico de 11 
semanas. 

Se selecciona al azar seis estudiantes de cada una de las tres licenciaturas, dos de cada uno de los tres programas 
de capacitación que impartió la universidad y cuyas calificaciones obtenidas por los candidatos se muestran en el 
cuadro 2.40, por lo que con base en éstas se desea saber: 

• ^Difieren los programas de capacitación en cuanto a sus efectos sobre las calificaciones de la evaluación de 
aptitudes? 

• ^Difiere la formación acadèmica (licenciatura) en cuanto a sus efectos sobre las calificaciones de la evalua¬ 
ción de aptitudes? 

• ;Sc desempenan mejor los egresados de alguna licenciatura en determinado programa de capacitación, y 
los de otra licenciatura en otro tipo de programa de capacitación? 

Cuadro 2.40 Cada combinación (celda) se denomina como un tratamiento. 



Factor: Licenciatura 

1. Sociologia 

2. Ingeniería 3. Comunicación Soc. 



1 

20 hrs. 

58 

50 

46 

54 

40 

48 

Factor 





Programa 

II 

46 

56 

42 

de 

40 hrs. 

54 

62 

48 

Capacitación 





III 

56 

60 

48 


11 semanas 

60 

58 

41 


< 

d 

cg 

CL 


Procedimiento de càlculo del anàlisis de factores 

El procedimiento de càlculo del anàlisis de factores es similar a los dos procedimientos anteriores ya que nueva- 
mente se divide la suma de cuadrados y los grados de libertad que corresponde a cada fuente. La fórmula para 
dividir la suma de cuadrados en este método cuando se manejan dos factores es: 

SCT = SCA + SCB + SCAB + SCE (2.20) 

En donde la partición de la suma de cuadrados y de los grados de libertad se define con: 
a = Número de niveles del factor A. 
b = número de niveles del factor B. 
r = Número de réplicas (observaciones en cada bloque). 
n T = Número total de observaciones (datos) del experimento. 

X = Observación de la /r-ésima rèplica tomada del tratamiento i del factor A y del tratamiento j del factor B. 

X = Promedio de la muestra de las observaciones en el tratamiento i (factor A). 

X = Promedio de la muestra de las observaciones en el tratamiento j (factor B). 

X = Gran media de las muestras para n 7 observaciones. 
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• Suma de cuadrados del total (sct): 

5Cr = È ( 2 - 21 ) 

i=l j =1 k= 1 

SCT = (58 - 51.5) 2 + (50 - 51.5) 2 + (46 - 51.5) 2 + ... + (41 - 51.5) 2 = 824.50 

• Suma de cuadrados para el factor A (sca): 

SCA = br^(x, -f) 2 (2.22) 

í=l 

SCA= [(3)(2)[(49.333-51.5)] 2 + (51.333 - 51.5) 2 - (53.833 - 51.5) 2 ] = 61.0 

• Suma de cuadrados para el factor B (scb): 

SCB = arY,(x i - xf (2.23) 

7=1 

scb = [(3)(2)[(54 - 51.5)] 2 + (56 - 51.5) 2 + (44.5 - 51.5) 2 ] = 453.0 

• Suma de cuadrados para la interacción (SCAB): 

SCT = rf j f j (X ij -X i -X j + f) 2 (2.24) 

i =1 7=1 

SCAB = [(2)[(54 - 49.333 - 54 + 51.5)] 2 + (50 - 49.333 - 56 - 51.5) 2 + ... + (44.5 - 53.833 - 44.5 - 51.2) 2 ] = 112.0 

• Suma de cuadrados debido al error (SCE): 

SCE = SCT - SCA - SCB - SCAB 

SCE = 824.5-61.0-453.0- 112.0 = 198.5 

En el cuadro 2.41 elaborado con una hoja electrònica de Excel se muestra un resumen de los càlculos anteriores: 
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Cuadro 2.41 Resumen de càlculos. 


Factor: Licenciatura 


1. Sociologia 2. Ingeniería 3. Comunicación Soc. 



I 

58 

46 

40 

media de 


20 hrs. 

50 

54 

48 

medias filas 

Factor 

media 

54 

50 

44 

49.333 

Programa 

II 

46 

56 

42 


de 

40 hrs. 

54 

62 

48 


Capacitación 

media 

50 

59 

45 

51.333 


III 

56 

60 

48 



11 semanas 

60 

58 

41 



media 

58 

59 

44,5 

53.833 


media 






de medias 

54 

56 

44,5 



columnas 


Gran Media 
51.5 

SCT 

824.50 

SCA 

61.00 

SCB 

453 

SCAB 

112 
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Los càlculos se pueden mostrar en el cuadro 2.42: 


Cuadro 2.42 Resumen de anàlisis de factores. 


Fuente 

Suma 

de cuadrados 

Grados 
de libertad 

Varianza 
de la media 

F 

P 

Factor A 

SCA 

a-1 

VFA=SCA/(a-1) 

VFA/VE 

Significancia (sig.) 

Factor B 

SCB 

b -1 

VFB=SCB/(b- 1) 

VFB/VE 

Significancia (sig.) 

Interacción 

SCAB 

(a- 1)(à-1) 

VFAB=SCAB/(a -1 )(à -1) 

VFAB/VE 

Significancia (sig.) 

Error 

SCE 

ab(r- 1) 

VE=SCE/ab (r-1) 



Variación total 

SCA + SCB + 

SCAB + SCE 

n r~ 1 




Para el ejemplo, el cuadro resumen del anàlisis de factores se muestra en el cuadro 2.43 y una salida i 

programa spss de este problema en el 2.44. 




Cuadro 2.43 Anàlisis de factores. 


Suma 

Grados 

Varianza 



Fuente 

de cuadrados 

de libertad 

de la media 

F 

P 

Capacitación 

61.0 

2 

30.5 

1.383 

0.299 

Licenciatura 

453.0 

2 

226.5 

10.270 

0.005 

Interacción 

112.0 

4 

28.00 

1.270 

0.350 

Error 

198.5 

9 

22.06 



Variación total 

824.5 

17 
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Cuadro 2.44 Salida con el programa spss. 


Test of between subjets effects 

Dependent variable: calificación 

Source 

Type III sum 
orsquares 

df 

Mean square 

F 

Sig. 

Model 

48366.500 a 

9 

5374.056 

243.660 

0.000 

Programa 

61.000 

2 

30.500 

1.383 

0.299 

Licenciatura 

453.000 

2 

226.500 

10.270 

0.005 

Programa* 

Licenciatura 

112.000 

4 

28.000 

1.270 

0.350 

Error 

198.500 

9 

22.056 



Total 

48565.000 

18 





1 R squared = 0.996 (adjusted R squared = 0.992) 


Con base en la información de los cuadros 2.43 y 2.44 podremos responder a nuestras preguntas de investigación. 

• /.D i fi eren los programas de capacitación en cuanto a sus efectos sobre las caliíicaciones de la evaluación de 
aptitudes?: 

• El valor critico de F con a = 0.05, con dos grados de libertad en el numerador y nueve en el denominador es 
4.26. 
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• Puesto que la F(1.383) para los programas de capacitación es menor que el valor critico no podemos rechazar la 
hipòtesis nula. 

• El valor p = 0.299 nos confirma lo anterior y por lo tanto en este punto debemos conduir que no hay diferencias 
importantes entre los tres programas de capacitación para el examen de aptitudes del doctorado. 

• ^Difiere la formación acadèmica (licenciatura) en cuanto a sus efectos sobre las calificaciones de la evalua- 

ción de aptitudes?: 

• En este caso el valor calculado de F= 10.27 es mayor al valor en las tablas (4.26), lo que nos indica que sí hay 
diferencias significativas entre la formación acadèmica que afecta las calificaciones del examen. 

• El valor p = 0.005, confirma la afirmación anterior ya que 0.005 < 0.05, lo que nos indica que debemos rechazar 
la hipòtesis nula de este factor. 

• i Se desempenan mejor los egresados de alguna licenciatura en determinado programa de capacitación, y 

los de otra licenciatura en otro tipo de programa de capacitación?: 

• El valor en los cuadros de la Fcon a = 0.05, con cuatro grados de libertad en el numerador y nueve en el denomi¬ 
nador es 3.63. 

• Puesto que la F (1.270) para la interacción (programas-licenciaturas) es menor que el valor critico no tenemos 
motivos para creer que los tres programas de capacitación que se imparten son distintos en cuanto a preparar a 
los estudiantes de las diferentes licenciaturas que desean ingresar a este programa. 


Problemas 


1. El departamento de producción econòmica de la UAM-X està comparando los salarios iniciales de sus egre¬ 
sados en Administración, los cuales dependen del àrea de especialización seleccionada (Finanzas, Mercado- 
tecnia, Recursos Humanos y Producción). Se toma una muestra de 28 egresados. A un nivel de 5%, determine 
si hay diferencia en los salarios promedio de los egresados de esta licenciatura (véase el cuadro 2.45). 


Cuadro 2.45 Comparación de salarios iniciales de egresados de la UAM-X. 


Especialización 


"D 

Egresados 

Finanzas 

Mercadotecnia 

Recursos Humanos 

Producción 

0 

C/3 

0 

1 

23.2 

23.3 

22.1 

22.2 

íl 

03 

< 

2 

24.7 

22.1 

19.2 

22.1 

d 






c5 

CL 

3 

24.2 

23.4 

21.3 

23.2 

o 

T3 

4 

22.9 

24.2 

19.8 

21.7 

O 






ò 

5 

25.2 

23.1 

17.2 

20.2 

o 

C\J 

© 

6 

23.7 

22.7 

18.3 

22.7 

03 

CL 

o 

7 

24.2 

22.8 

17.2 

21.8 


Nota: Los ingresos estan dados en miles de pesos mensuales. 
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2. Farmacia de Similares desea comparar la producción diaria 
promedio de suministros médicos de sus tres plantas de la 
zona central del país. Se recolectaron los datos de los últimos 
nueve días en cada planta. A un nivel de 10% existen dife- 
rencias en las medias de producción de sus plantas {véase el 
cuadro 2.46). 


Cuadro 2.46 Producción diaria promedio 
de suministros médicos. 


Planta 

Muestra 

Toluca 

Puebla 

Cuernavaca 

1 

10 

15 

12 

2 

12 

17 

17 

3 

15 

18 

15 

4 

18 

12 

15 

5 

9 

13 

18 

6 

17 

11 

12 

7 

15 

12 

13 

8 

12 

11 

14 

9 

18 

12 

14 


Nota: Producción en miles de unidades. 


3. La casa de bolsa MONEX México desea deter¬ 
minar si el promedio de comisiones diarias que 
ganan sus corredores cambia según el día de la 
semana. Se cuenta con los datos de siete de sus 
corredores que laboraron la semana pasada, por 
tanto determine (véase el cuadro 2.47). 

a) Si hay cambio en el promedio de comisiones 
por día de la semana, 

b) ^Qué días parecen ganar mas? 

c) Utilice el criterio de Tukey. 


Cuadro 2.47 Promedio de comisiones diarias que ganan 
sus corredores cambia según el día de la semana. 


Corredor 

Lunes 

Martes 

Miércoles 

Jueves 

Viernes 

1 

2100 

2800 

1100 

1500 

2500 

2 

2600 

2100 

1400 

1400 

2300 

3 

2400 

1900 

1200 

1200 

2600 

4 

3200 

1500 

1000 

1200 

2800 

5 

2500 

1200 

1000 

1600 

2400 

6 

2600 

1000 

1200 

1300 

2500 

7 

2400 

1300 

1500 

1800 

2900 


Nota: Comisiones en pesos. 
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4. Se registran las ventas diarias de tres tiendas WALL-MARK en la zona sur de la ciudad de México durante 
cinco días. El gerente regional desea saber si las ventas promedio en estas tiendas son similares, por tanto 
determine {véase el cuadro 2.48): 


a) A un nivel de significancia de 5% Cuadro 2 48 Ventas diarjas de tres 

a que conclusión llega. tiendas WALL-MARK durante cinco días. 


b) 7 ,Qué tienda parecen ganar mas? 



Tienda 


c) Utilice el criterio de Tukey. 

Día 

Miramontes 

Coapa 

Tlalpan 

1 

32 

44 

33 


2 

20 

43 

36 


3 

30 

44 

35 


4 

26 

46 

36 


5 

32 

48 

40 


Nota: Miles de pesos. 
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